Day25 CRAG (Corrective Retrieval-Augmented Generation )

2025 iThome 鐵人賽

DAY 25

AI & Data

AI初學者入門系列第 25 篇

17th鐵人賽

kitty71336

團隊新手小黑

2025-08-27 21:05:46

497 瀏覽

分享至

一. 背景

在傳統的檢索增強生成（RAG）中，模型往往「檢索即用」：檢索到的文件直接交給模型生成答案。這種方式雖然方便，卻容易被錯誤資訊誤導。CRAG（Corrective RAG） 則提出另一種思路「檢索後修正」: 在生成之前，先對檢索結果進行過濾、檢查、驗證，讓模型輸出的內容更可靠。

二、CRAG 的概念

CRAG 比起RAG，插入了 Correction Layer。
其主要思路包含三個步驟：

檢索（Retrieve）
與傳統 RAG 相同，先從向量資料庫中檢索出候選文件（Top-K）。
修正（Correct）
引入過濾與驗證模組：使用 LLM 或輕量模型判斷檢索結果是否相關。
移除低相關或有誤導性的文件。
生成（Generate）
將經過修正過的文件餵給 LLM，生成更可靠的回應。

三、技術細節

Correction Layer 的設計

過濾式 Correction
使用判斷模型（如 cross-encoder, 微調 LLM）的文件相似度，去除無關資訊。
一致性檢查（Consistency Check）
讓 LLM 自問自答：比較不同文件之間是否矛盾
事實驗證（Fact-Verification）
將候選文件中的關鍵陳述丟到外部知識並做二次檢查。

融合策略

Weighted Fusion：對文件設定信任分數（Trust Score）
Contrastive Decoding：在生成時同時考慮正樣本（可信文件）與反樣本（不可信文件），降低幻覺。
多代理協作（例如 Agentic Workflow）
例如:Agent A 負責檢索、Agent B 負責糾錯、Agent C 負責最終生成

四、挑戰

成本問題
Correction Layer 要額外推理，需增加成本
糾錯的可靠性
若 Correction Layer 本身判斷錯誤，可能反而丟掉正確文件。

Day24 HyDE（Hypothetical Document Embeddings）

Day26 介紹MCP (Model Context Protocol)

系列文

AI初學者入門共 30 篇

RSS系列文訂閱系列文

9 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IntelliJ IDEA 右上方run箭頭反灰

IT邦幫忙

AI初學者入門系列 第 25 篇